Как стать автором
Обновить

Моя лента

Тип публикации
Порог рейтинга
Уровень сложности
Предупреждение
Войдите или зарегистрируйтесь, чтобы настроить фильтры
Новость

Данные обучения китайских токенов GPT-4o оказались заспамлены и содержат порнозапросы

Время на прочтение4 мин
Количество просмотров13

Тианле Цай, аспирант Принстонского университета, изучающий эффективность вывода в больших языковых моделях, получил доступ к библиотеке токенов GPT-4o и извлёк список из 100 самых длинных китайских токенов, которые ИИ использует для анализа и вывода подсказок на китайском языке. Ранее пользователи из КНР пожаловались, что GPT-4o выдаёт ответы со спамом и элементами порно.

Читать далее
Рейтинг0
Комментарии0

Новости

Статья

Наука против возраста: как перепрограммировать организм

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров26

Победить старение человека и позволить ему обрести вечную (ну, или хотя бы более продолжительную) жизнь — одна из самых желанных и труднодостижимых целей науки. Огромное количество загадок, связанных с причинами и механизмами этого процесса, делало задачу нереальной. Но в последние годы ученые, кажется, нашли способ не просто останавливать старение, но обращать его вспять.

Вообще, этот текст совсем не похож на то, что мы обычно публикуем на Хабре. Но мимо такой темы пройти очень сложно: слишком редко в этой области случаются прорывы, подобные этому. Ну, и потом, решение вопроса старения очень похоже на попытки разобраться, как работает код, местами еще и обфусцированный, чтобы заставить приложение делать то, что нужно. На этом заканчиваем оправдываться и переходим к сути.  

Читать далее
Рейтинг0
Комментарии0
Статья

next.module: публичное обсуждение и рекомендации автору

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров62


Наткнулся я тут недавно на ролик презентации проекта next.module — это продолжение задумки автора Руслана, известного по замечательному проекту «Электроника в объективе», о которой он год назад рассказал в статье на Хабре.

То есть проект развивается и уже перешёл в фазу создания реальных прототипов. Это не может не радовать — как говорится, больше проектов хороших и разных, тем более, что автор на деле доказал свою компетентность и «креативность» (в хорошем смысле этого слова).

Но я, со своей колокольни, вижу кучу странностей в концепции и архитектуре next.module и постараюсь рассказать о них в этой статье. Возможно что-то из моих замечаний поможет избежать проблем в будущем для этого многообещающего проекта.

Всех желающих также приглашаю высказать своё мнение в комментах.
Читать дальше →
Рейтинг0
Комментарии0
Статья

Почтовый сервер с нуля. Часть вторая

Уровень сложностиСредний
Время на прочтение27 мин
Количество просмотров63

Приветствую всех читателей!

Подошло время для второй части нашей серии статей по настройке почтового сервера. Напомню, что в первой части мы рассмотрели основные моменты, касающиеся настройки почтового сервера, а также конфигурировали Exim4 для корректной отправки почты.

В этой статье мы настроим полноценный почтовый сервер. Использовать будем PostfixAdmin, Dovecot и RainLoop.

Давайте настроим!
Всего голосов 1: ↑1 и ↓0+1
Комментарии0

Истории

Статья

Безопасность первична: сетевое взаимодействие и привилегии контейнеров в Docker

Время на прочтение8 мин
Количество просмотров34

Привет, Хабр! Меня зовут Эллада, я специалист по информационной безопасности в Selectel. Продолжаю рассказывать о безопасности в Docker. В новой статье поговорим о сетевом взаимодействии контейнеров, правильном управлении привилегиями и ограничении потребления системных ресурсов.

Поделюсь, почему не стоит использовать bridge docker0 и network namespace хоста, чего не стоит делать при монтировании каталогов и многими другими советами. Придерживайтесь наших рекомендаций и сделайте работу с Docker еще более защищенной!
Читать дальше →
Всего голосов 1: ↑1 и ↓0+1
Комментарии0
Пост

Как живется в гибридном облаке производителю косметики и крупнейшему селлеру категории «Красота» популярного фиолетового маркетплейса?

Начинала свой облачный путь компания Mixit больше пяти лет назад по классической схеме — серверы в бизнес‑центре с живущей на них 1С. По мере развития бизнеса стало понятно, что часть значительную часть инфраструктуры нужно переносить в облака. Что и было сделано, решение это оказалось крайне удачным. Именно оно позволило справиться с растущим спросом и соответствующими нагрузками на инфраструктуру.

 Как технически реализована облачная структура Mixit, для чего компания использует арендованные сервера и как экономит на техническом персонале — обо всем этом в видео ниже рассказывает IT‑директор компании Mixit Алексей Корепанов. Также там вы найдете нюансы работы с данными ритейла, впечатления от пяти лет в облаках и многое другое.

Приятного и полезного просмотра!

Этот ролик — запись доклада на митапе OXYGEN в Санкт‑Петербурге. Подробно про мероприятие можно почитать вот здесь.

А у вас есть опыт работы с крупным ритейлом на облачных платформах? Какие характеристики особенно важны для таких клиентов? Расскажите о своем опыте в комментариях!

И обязательно подписывайтесь на наш канал в Telegram, там мы не только постим новости про IT, но и рассказываем про облака, дата‑центры и кибербез.

Теги:
+2
Комментарии0
Статья

Утечки памяти в мобильных приложениях: руководство для QA-инженеров

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров112

Меня зовут Ира и я руковожу отделом тестирования мобильной платформы: наш отдел занимается разработкой инструментов для автоматизации тестирования мобильных приложений Ozon и тестированием внутренних библиотек, которые используются в наших приложениях. Около года назад мы пытались понять, почему у одной из команд джоба с автотестами отваливается по тайм-ауту. К слову, это был проект мобильного приложения для продавцов, и на нем у нас для автоматизации тестирования используются нативные фреймворки: Kaspresso + Kotlin для Android и XCTest + Swift для iOS.

Одна из гипотез заключалась в том, что в приложении могут быть утечки памяти и что-то зависает. Спойлер: дело было не в этом. В общем, около года назад я проверяла, что к чему там у нас с памятью приложения, а сейчас поняла, что полученными знаниями можно и поделиться.

Эта статья будет полезна тем, кто только начинает изучать, что происходит со стабильностью мобильного приложения. Внутри статьи разберёмся с тем, как приложение работает с оперативной памятью; что такое утечки памяти и когда они возникают; как утечки влияют на стабильность работы приложения и как их находить.

Читать далее
Всего голосов 3: ↑3 и ↓0+3
Комментарии0
Статья

Custom Kafka Deserializer и Spring’овый контекст. Как инжектить в статические поля

Время на прочтение4 мин
Количество просмотров50

В блоге beeline cloud я рассказывал о Spring Data JPA, Hibernate, делился личными наблюдениями, как облегчить себе жизнь при написании тестов. Сегодня речь о другом: расскажу, как инжектить в статические поля. Как всегда — на примерах. Поехали.

На практике десериализаторов, представленных в ядре Spring, хватает в 99% случаев. Но бывают ситуации, когда всё же требуется описать свою логику предобработки входящего сообщения.

Для наглядности предлагаю рассмотреть гипотетический случай, когда на вход Kafka подается строка лога с задаваемым разделителем. В этой строке нас интересует лишь часть сообщения: мы будем делить строку по определенному символу и собирать из получившегося массива новую строку.

Читать далее
Рейтинг0
Комментарии0
Пост

⚡️ SELF-DISCOVER — система для улучшения способности LLM рассуждать

Исследователи из Google DeepMind и Университета Южной Калифорнии представили революционный подход к повышению способности к рассуждению больших языковых моделей (LLM). Их новая система «SELF-DISCOVER», презентованная на этой неделе на arXiV и Hugging Face, обещает существенные улучшения в решении сложных задач рассуждениий, потенциально революционизируя производительность ведущих моделей, таких как GPT-4 от OpenAI и PaLM 2.

Система демонстрирует повышение производительности до 32% по сравнению с традиционными методами, такими как цепочка мыслей (CoT). Этот подход основан на том, что LLM самостоятельно раскрывают внутренние структуры рассуждений, присущие задачам, для решения сложных проблем, например таких, как критическое мышление или пошаговый анализ.

Имитируя человеческие стратегии решения проблем, эта система работает в два этапа. Первый этап включает в себя составление связной структуры рассуждений, свойственной задаче, с использованием набора атомарных модулей рассуждения и примеров задач. На втором этапе – во время декодирования, LLM следуют этой самообнаруженной структуре, чтобы прийти к окончательному решению.

В обширном тестировании различных задач на рассуждение, включая Big-Bench Hard, Thinking for Action и Math, предложенный подход неизменно превосходил традиционные методы.

Если интересуетесь темой МЛ и нейросетей, здесь я публикую разбор свежих моделей, статей и гайдов, кладешь полезной информации.

Теги:
0
Комментарии0
Новость

Uber перенесла базу данных c 1 трлн записей из DynamoDB в LedgerStore

Время на прочтение3 мин
Количество просмотров386

Uber перенесла все свои данные о платёжных транзакциях из DynamoDB и хранилища BLOB-объектов в новое долгосрочное решение — LedgerStore. Компания стремится сократить расходы на $6 млн ежегодно.

Читать далее
Всего голосов 1: ↑1 и ↓0+3
Комментарии1
Статья

Станут ли ИИ-стартапы пузырем, который лопнул?

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров194

Прошедший год был очень успешным для индустрии искусственного интеллекта. Cтоимость стартапов-единорогов выросла в 2023 году на 22,9%, а 44% из всех новых "единорогов" специализировались на искусственном интеллекте и машинном обучении. Лучше росли только стартапы в сфере кибербезопасности - на 24,3%.

Основной вклад в повышение стоимости ИИ-стартапов в 2023 году внесли OpenAI, которая привлекла 10 миллиардов $ инвестиций от Microsoft, Anthropic получившая 7,3 миллиардов $ — основные инвесторы Amazon и Google, и Inflection AI с 1,3 миллиарда $ от Microsoft.

Читать далее
Рейтинг0
Комментарии0
Пост

ML против токсичности, чат‑бот «пИИрожок» — и ещё более 10 кейсов внедрения технологий машинного обучения на конференции ML2Business.

29 мая в 14:00 приглашаем на ML2Business — первую конференцию от Yandex Cloud, посвящённую кейсам применения GenAI, NLP, CV и других технологий ML.

Мы поговорим о сложностях внедрения моделей машинного обучения и способах интеграции ML в процессы компаний, а также об оценке реальной пользы для бизнеса. Будет интересно и полезно как ИТ‑руководителям, так и ML‑экспертам — присоединяйтесь к нам в пространстве LOFT#2 в Москве или подключайтесь онлайн.

В программе

  • как YandexGPT меняет привычные процессы работы колл‑центра;

  • зачем внедрять нейросети для категоризации запросов в техподдержку;

  • как улучшить качество сервиса для знакомств благодаря модерации контента с помощью ML‑технологий;

  • что умеют современные виртуальные рекрутёры с функцией RPA;

  • как чат‑боты помогают покупателям подбирать товары на основании их предпочтений;

  • как улучшить поиск информации по внутренней «википедии» с помощью ассистента на базе YandexGPT API и Yandex DataSphere;

    и ещё несколько практических примеров от компаний из разных отраслей.

Участники также могут поучаствовать в нетворкинге и тестировании ML‑сервисов в реальных бизнес‑сценариях на интерактивных площадках.

Участие бесплатное, количество мест ограничено. Регистрация открыта на сайте конференции.

Теги:
+3
Комментарии0
Статья

Моделирование оргструктур и бизнес-процессов при имплементации ERP-систем

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров84

Одной из важных задач при имплементации корпоративных информационных систем является проектирование бизнес-процессов. Следуя [1], в ERP-проектах выделяется отдельный уровень внедрения: уровень процессов. Здесь ведется моделирование бизнес-процессов на основе общеизвестных графических нотаций, строятся модели As-Is и To-Be. Все разнообразие нотаций моделирования объединено термином CASE-средства, суть которых изначально заключалась как в проектировании, так и последующей автоматизации настроек и разработок ERP-систем [2].

На сегодняшний деть имеется множество всевозможных нотаций моделирования бизнес-процессов, каждая из которых обладает своим набором уникальных графических элементов, особенностями и областью применения. Не все нотации изначально создавались под нужны ERP-проектов, поэтому их использование при проектировании корпоративных информационных систем не всегда разумно. Имплементация информационных систем – задача весьма специфичная и трудоемкая, поэтому выбор нотации должен вестись весьма осознанно.

В принципе, применение неподходящего CASE-средства не так критично, однако это приводит к излишним трудозатратам, так как построенные схемы процессов будут содержать излишние или наоборот недостающие графические элементы, важные для конечных пользователей. Исходя из этого, необходимо разбираться в тонкостях нотаций моделирования и четко разграничивать область применения каждой. Именно это задачей мы с вами и займемся в рамках данной работы.

Цель работы заключается в анализе методов проектирования бизнес-процессов, применимых к проектам внедрения ERP-систем. Использование подходящих графических моделей позволит строить наглядные процессные диаграммы, удобные для конечных пользователей, что облегчит им работу с разрабатываемой программной системой. Достижение цели потребует решения таких задач, как:

Читать далее
Рейтинг0
Комментарии0

Ближайшие события

Новость

Переиздание игры «Периметр: Legate Edition» вышло в Steam

Время на прочтение1 мин
Количество просмотров402

Как сообщает "Ассоциация K-D Lab", ремастер российской игры 2004 года "Периметр" вышел в Steam под названием "Периметр: Legate Edition"

Переиздание вышло на 20-летие игры, которая изначально была выпущена 21 мая 2004 года.

Переиздание разработано на базе исходников, выпущенных в Open Source и переработанных сообществом. В переиздание входит поддержка больших разрешений экрана, улучшенные модели и текстуры, возможность играть через интернет, дополнение "Завет Императора", а также огромное количество доработок и исправлений.

"Периметр" является одной из самых необычных RTS, когда-либо выпущенных. Геймплей основан на возможности терраморфинга, в котором масштаб выровненной земли становится источником энергии. Другой особенностью является трансформация юнитов - воздушные юниты в любой момент могут быть преобразованы в подземные, подземные в наземные и так далее. При этом сюжет игры является своеобразным приквелом к игре "ВанГеры", рассказывая историю Цепи Миров.

Читать далее
Всего голосов 1: ↑1 и ↓0+1
Комментарии1
Статья

200 таблиц в одном дашборде: как мы создаём проект визуализации данных медицинской статистики

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров242

Хабровчане, приветствую! Меня зовут Андрей Иванов, я системный аналитик в сфере медицины и здравоохранения. До 2005 года работал врачом, потом руководил медицинским информационно-аналитическим центром. Спустя время возникла настоятельная потребность научиться делать самостоятельно то, чем прежде приходилось руководить, — так я поступил на курс «Системный аналитик» в Практикуме.

Возможно, это вступление показалось вам знакомым. В начале года я рассказывал про проект визуализации медицинских данных, который мы со студентами сделали в Мастерской Практикума. Сейчас — расскажу, как мы продолжили работу во второй Мастерской, и покажу, на что теперь способен наш инструмент.

Читать далее
Всего голосов 6: ↑5 и ↓1+4
Комментарии0
Статья

Разработка манипулятора для игры в шахматы

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров245

В этой статье я хочу рассказать про наш проект по созданию манипулятора, позволяющего удаленно играть в обычные шахматы — о том как мы его делали, и каких результатов удалось добиться.

Читать далее
Всего голосов 2: ↑2 и ↓0+2
Комментарии0
Статья

Кибер Инфраструктура 5.5. Обзор новинок

Время на прочтение8 мин
Количество просмотров116

Привет Хабр! 

Сегодня познакомимся с ключевыми новинками в версии 5.5 нашего продукта "Кибер Инфраструктура". Кибер Инфраструктура — это универсальное решение, которое представляет собой мультипротокольное программно-определяемое хранилище и платформу виртуализации в одном продукте. 

Читать далее
Рейтинг0
Комментарии0
Статья

Еда как софт

Время на прочтение13 мин
Количество просмотров300
image

Еды на планете нужно больше. В белковой пище идёт борьба за коэффициент получения белка с единицы корма. Текущая оптимальная технология преобразования называется «курица», уже где-то близко — насекомые, а прямо за углом — вторая революция одомашнивания, когда еду будут делать бактерии, как сейчас они делают нам инсулин и много других компонентов для фармы в своих биореакторах.

Это неожиданно открывает возможность не просто генерировать еду, но заодно и вмешаться в процесс её создания и пофиксить всё то, что давно надо было пропатчить и обновить. ДНК-модификации — уже давно не новость, там проблемы только с экономической стороной. И они постепенно решаются.

В общем, давайте пройдёмся по тому, как еду видели фантасты, и тому, как их прогнозы исполняются. Ну или почти исполняются.
Читать дальше →
Всего голосов 6: ↑6 и ↓0+8
Комментарии2
Статья

Почему я веду ИТ-бизнес в России

Время на прочтение6 мин
Количество просмотров821
image

Вы, возможно, знаете правила ведения ИТ-бизнеса в России. Особенно первое. Я тоже знаю, но веду дела именно в России и из России.

В последнюю пару лет меня почему-то начали чаще спрашивать о том, почему так. Отвечаю.

Во-первых, у нас низкие налоги.

Во-вторых, всё ещё открыто много возможностей, регуляторка не дошла до уровня hard/hardcore, как в Европе и США. Наверняка сейчас вы будете смеяться, но я знаю, о чём говорю: у нас нет такой бюрократии и такого ада проверок. У нас услуга юриста — это всё ещё уровень ChatGPT 3.5, а не коллектив специально обученных гиков в очках.

В-третьих, у нас дешёвая рабочая сила — ну, относительно структуры затрат во многих других крупных странах. По крайней мере, мидлы — точно.

В-четвёртых, у нас крупная страна: минимум 150 миллионов только в России плюс ещё всё русскоговорящее пространство. Это очень большой и доступный рынок с на самом деле не очень высокой конкуренцией.

Ну и, наконец, в-пятых, я русский. Не в смысле, что со мной Бог, а в смысле того, что если я начну вести бизнес в других юрисдикциях, то меня из-за санкций могут в любой момент нагнуть.

Так что знаю, сейчас в меня могут полететь помидоры, но именно в России я себя чувствую наиболее безопасно и спокойно. Несмотря на то, что главный минус нашей локали — отсутствие каких-либо стабильности и предсказуемости.
Читать дальше →
Всего голосов 23: ↑16 и ↓7+15
Комментарии7
Статья

Не магия: как агрегируются и обрабатываются данные CDP-платформами

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров88

В недавно опубликованной статье CleverData постаралась разгадать, как и почему совершаются спонтанные покупки. Над нашими намерениями круглосуточно работают  Customer Data Platforms (CDP) - гибкие платформы накопления данных о пользователях для целей персонализации предложений. Именно поэтому оповещение о скидке на абонемент в спортзал приходит тогда, когда мы вдруг решаем худеть и заказываем доставку диетического питания. Как грамотное применение CDP напрямую влияет на продажи, читайте в нашей новой статье под катом. 

Читать далее
Рейтинг0
Комментарии1
1
23 ...